AI

Η Microsoft διευρύνει το χαρτοφυλάκιο ΤΝ με νέα μοντέλα Phi-3.5: Ένα μεγάλο βήμα προς την ισχυρή πολυτροπικότητα

Η Microsoft παρουσίασε τρία νέα μοντέλα της σειράς Phi-3.5, που σηματοδοτούν σημαντικές προόδους προς την κορυφαία θέση στην ανάπτυξη τεχνητής νοημοσύνης.

Eulerpool News 27 Αυγ 2024, 11:01 π.μ.

Η Microsoft συνεχίζει την εντυπωσιακή της επιτυχία στον τομέα της τεχνητής νοημοσύνης και ανακοίνωσε σήμερα την κυκλοφορία τριών νέων μοντέλων στη σειρά Phi-3.5. Αυτά τα μοντέλα, που διακρίνονται από τις προηγμένες λειτουργίες πολυτροπικότητας και πολυγλωσσίας, στοχεύουν να επαναστατήσουν περαιτέρω την αγορά εφαρμογών που βασίζονται στην τεχνητή νοημοσύνη. Τα μοντέλα διατέθηκαν υπό μια άδεια MIT με το εμπορικό σήμα της Microsoft στο Hugging Face, δίνοντας τη δυνατότητα στους προγραμματιστές παγκοσμίως να χρησιμοποιούν, να προσαρμόζουν και να βελτιώνουν ελεύθερα αυτές τις καινοτόμες τεχνολογίες.

Τα τρία μοντέλα – Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct και Phi-3.5-vision-instruct – καλύπτουν ένα ευρύ φάσμα εφαρμογών, από βασικές έως εξαιρετικά σύνθετες εργασίες. Κάθε μοντέλο είναι βελτιστοποιημένο για συγκεκριμένες απαιτήσεις, όπως για παράδειγμα γρήγορη και ακριβή αιτιολόγηση ή την επεξεργασία κειμένων και εικόνων σε πολυτροπικές εργασίες.

Το μοντέλο εκπαίδευσης Phi-3.5 Mini, εξοπλισμένο με 3,8 δισεκατομμύρια παραμέτρους, είναι ένα ελαφρύ μοντέλο που έχει σχεδιαστεί ειδικά για χρήση σε περιβάλλοντα με περιορισμένη μνήμη ή υπολογιστική ισχύ. Δείχνει εντυπωσιακές επιδόσεις σε εργασίες που απαιτούν ισχυρή λογική σκέψη, όπως η παραγωγή κώδικα, η επίλυση μαθηματικών προβλημάτων και οι ερωτήσεις που βασίζονται σε λογική. Παρά το συμπαγές μέγεθός του, ξεπερνάει τα άλλα μοντέλα της κατηγορίας του, όπως το Llama-3.1-8B-instruct, ιδιαίτερα σε εργασίες που απαιτούν κατανόηση μακροχρονιών συμφραζομένων, στην αξιολόγηση RepoQA.

Das Phi-3.5 MoE (Mixture of Experts) Modell ist das erste seiner Art in Microsofts Portfolio. Es kombiniert verschiedene Modelltypen, die jeweils auf unterschiedliche Aufgaben spezialisiert sind, und kann somit komplexe KI-Aufgaben effizient bewältigen. Mit 42 Milliarden aktiven Parametern bietet es skalierbare Leistungen und unterstützt Kontexte mit bis zu 128.000 Tokens. Es übertrifft beeindruckend GPT-4o mini im 5-shot MMLU-Benchmark in Bereichen wie STEM, Geisteswissenschaften und Sozialwissenschaften, was seine Vielseitigkeit und Leistungsfähigkeit unterstreicht.

Το μοντέλο Phi-3.5 MoE (Mixture of Experts) είναι το πρώτο του είδους του στο χαρτοφυλάκιο της Microsoft. Συνδυάζει διαφορετικούς τύπους μοντέλων, καθένας από τα οποία ειδικεύεται σε διαφορετικές εργασίες, και έτσι μπορεί να χειριστεί πολύπλοκες εργασίες τεχνητής νοημοσύνης αποτελεσματικά. Με 42 δισεκατομμύρια ενεργούς παραμέτρους, προσφέρει κλιμακούμενες επιδόσεις και υποστηρίζει συμφραζόμενα με μέχρι και 128.000 tokens. Υπερτερεί εντυπωσιακά του GPT-4o mini στη δοκιμασία MMLU με 5 παραδείγματα σε τομείς όπως STEM, ανθρωπιστικές επιστήμες και κοινωνικές επιστήμες, τονίζοντας την ευελιξία και την αποδοτικότητά του.

Το μοντέλο Phi-3.5 Vision Instruct ενσωματώνει ικανότητες επεξεργασίας κειμένου και εικόνας, καθιστώντας το ιδανικό για εργασίες όπως γενική επεξεργασία εικόνας, οπτική αναγνώριση χαρακτήρων και περιλήψεις βίντεο. Με υποστήριξη για μήκη συμφραζόμενων έως 128k token, αυτό το μοντέλο μπορεί να διαχειριστεί σύνθετες, πολυεπίπεδες οπτικές εργασίες. Η Microsoft τονίζει ότι το μοντέλο έχει εκπαιδευτεί σε έναν συνδυασμό συνθετικών και δημοσίως διαθέσιμων συνόλων δεδομένων, με έμφαση σε δεδομένα υψηλής ποιότητας και απαιτητικά στον τομέα της συλλογιστικής.

Όλα τα τρία μοντέλα της σειράς Phi-3.5 κυκλοφόρησαν με άδεια MIT, τονίζοντας τη δέσμευση της Microsoft για την υποστήριξη της κοινότητας ανοιχτού κώδικα. Αυτή η άδεια επιτρέπει στους προγραμματιστές να χρησιμοποιούν, να τροποποιούν και να διανέμουν το λογισμικό ελεύθερα, ενώ ταυτόχρονα πρέπει να τηρούν τις αποποιήσεις ευθυνών της Microsoft και των άλλων κατόχων πνευματικών δικαιωμάτων.

Η κυκλοφορία των μοντέλων Phi-3.5 αντιπροσωπεύει μια σημαντική πρόοδο στην ανάπτυξη πολυγλωσσικών και πολυτροπικών τεχνητών νοημοσυνών. Με αυτά τα μοντέλα, η Microsoft προσφέρει στους προγραμματιστές τη δυνατότητα να ενσωματώσουν προηγμένες δυνατότητες τεχνητής νοημοσύνης στις εφαρμογές τους, προωθώντας την καινοτομία τόσο στον εμπορικό τομέα όσο και στον ερευνητικό.

Κάνε τις καλύτερες επενδύσεις της ζωής σου
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Ασφαλίστε από 2 ευρώ

Ειδήσεις